<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   DingPeng: 因果推断简介之一：从 Yule-Simpson’s Paradox 讲起  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]},
          TeX: {equationNumbers: {autoNumber: "AMS"}}
        });
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/2012/03/causality1-simpson-paradox/",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466461899: Accept with keywords: (title(0.4):中国,统计学,服务平台,因果,门户网站, topn(0.366666666667):因素,正相关,统计学家,人群,统计学,性别,总体,结果,负作用,模型,教科书,例子,文章,数据,铀矿,因果,男性,肺癌,变量,误差,随机化,样本量,流行病学,交互作用,关系,问题,因果关系,悖论,理论,物理).-->
 </head>
 <body class="single single-post postid-4794 single-format-standard sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    DingPeng: 因果推断简介之一：从 Yule-Simpson’s Paradox 讲起
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/">
       <img src="http://cos.name/wp-content/themes/COS-kermesinus/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <a class="screen-reader-text skip-link" href="http://cos.name/2012/03/causality1-simpson-paradox/#content" title="跳至内容">
        跳至内容
       </a>
       <div class="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95-container">
        <ul class="nav-menu" id="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-4746" id="menu-item-4746">
          <a href="http://cos.name">
           主页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-8120" id="menu-item-8120">
          <a href="http://cos.name/cn">
           论坛
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8124" id="menu-item-8124">
            <a href="http://cos.name/cn/wp-login.php?action=register">
             论坛注册
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8125" id="menu-item-8125">
            <a href="http://cos.name/cn/wp-login.php">
             论坛登录
            </a>
           </li>
          </ul>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8110" id="menu-item-8110">
          <a href="http://cos.name/books/">
           图书资料
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8112" id="menu-item-8112">
          <a href="http://cos.name/videos">
           视频教程
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8333" id="menu-item-8333">
          <a href="http://cos.name/salon/">
           统计沙龙
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8111" id="menu-item-8111">
          <a href="http://cos.name/chinar/">
           R语言会议
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8109" id="menu-item-8109">
          <a href="http://cos.name/training/">
           讲座与培训
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8115" id="menu-item-8115">
          <a href="http://cos.name/cn/forum/comprehensive/job/">
           招聘信息
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-4780" id="menu-item-4780">
          <a href="http://cos.name/about">
           关于我们
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8113" id="menu-item-8113">
            <a href="http://cos.name/2008/11/how-to-work-with-cos/">
             加入我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8119" id="menu-item-8119">
            <a href="http://cos.name/donate/">
             赞助我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8114" id="menu-item-8114">
            <a href="http://cos.name/cn/forum/26">
             项目合作
            </a>
           </li>
          </ul>
         </li>
        </ul>
       </div>
       <form action="http://cos.name/" class="search-form" method="get" role="search">
        <label>
         <span class="screen-reader-text">
          搜索：
         </span>
        </label>
       </form>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-4794 post type-post status-publish format-standard hentry category-inference tag-causality-inference tag-donald-rubin tag-j-pearl tag-yule-simpsons-paradox tag-542 tag-539 tag-543 tag-540 tag-541" id="post-4794">
        <header class="entry-header">
         <h1 class="entry-title">
          因果推断简介之一：从 Yule-Simpson’s Paradox 讲起
         </h1>
         <div class="entry-meta">
          <span class="date">
           <a href="http://cos.name/2012/03/causality1-simpson-paradox/" rel="bookmark" title="链向因果推断简介之一：从 Yule-Simpson’s Paradox 讲起的固定链接">
            <time class="entry-date" datetime="2012-03-26T10:04:14+00:00">
             2012/03/26
            </time>
           </a>
          </span>
          <span class="categories-links">
           <a href="http://cos.name/category/classical/inference/" rel="category tag">
            统计推断
           </a>
          </span>
          <span class="tags-links">
           <a href="http://cos.name/tag/causality-inference/" rel="tag">
            Causality Inference
           </a>
           、
           <a href="http://cos.name/tag/donald-rubin/" rel="tag">
            Donald Rubin
           </a>
           、
           <a href="http://cos.name/tag/j-pearl/" rel="tag">
            J. Pearl
           </a>
           、
           <a href="http://cos.name/tag/yule-simpsons-paradox/" rel="tag">
            Yule-Simpson's Paradox
           </a>
           、
           <a href="http://cos.name/tag/%e5%9b%a0%e6%9e%9c%e5%85%b3%e7%b3%bb/" rel="tag">
            因果关系
           </a>
           、
           <a href="http://cos.name/tag/%e5%9b%a0%e6%9e%9c%e6%8e%a8%e6%96%ad/" rel="tag">
            因果推断
           </a>
           、
           <a href="http://cos.name/tag/%e7%9b%b8%e5%85%b3%e5%85%b3%e7%b3%bb/" rel="tag">
            相关关系
           </a>
           、
           <a href="http://cos.name/tag/%e8%be%9b%e6%99%ae%e6%a3%ae%e6%82%96%e8%ae%ba/" rel="tag">
            辛普森悖论
           </a>
           、
           <a href="http://cos.name/tag/%e9%9a%8f%e6%9c%ba%e5%8c%96%e8%af%95%e9%aa%8c/" rel="tag">
            随机化试验
           </a>
          </span>
          <span class="author vcard">
           <a class="url fn n" href="http://cos.name/author/dingpeng/" rel="author" title="查看所有由丁鹏发布的文章">
            丁鹏
           </a>
          </span>
         </div>
         <!-- .entry-meta -->
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <p>
          <a href="http://cos.name/wp-content/uploads/2012/03/causality2-cover.jpg">
           <img src="http://cos.name/wp-content/uploads/2012/03/causality2-cover-211x300.jpg"/>
          </a>
         </p>
         <p>
          在国内的时候，向别人介绍自己是研究因果推断（causal inference）的，多半的反应是：什么？统计还能研究因果？这确实是一个问题：统计研究因果，能，还是不能？直接给出回答，比较冒险；如果有可能，我需要花一些篇幅来阐述这个问题。
         </p>
         <p>
          目前市面上能够买到的相关教科书仅有 2011 年图灵奖得主 Judea Pearl 的
          <a href="http://bayes.cs.ucla.edu/BOOK-2K/" target="_blank">
           Causality: Models, Reasoning, and Inference
          </a>
          。Harvard 的统计学家 Donald Rubin 和 计量经济学家 Guido Imbens 合著的教科书历时多年仍尚未完成；Harvard 的流行病学家 James Robins 和他的同事也在写一本因果推断的教科书，本书目前只完成了第一部分，还未出版（
          <a href="http://www.hsph.harvard.edu/faculty/miguel-hernan/causal-inference-book/" target="_blank">
           见此处
          </a>
          ）。我本人学习因果推断是从 Judea Pearl 的教科书入手的，不过这本书晦涩难懂，实在不适合作为入门的教科书。Donald Rubin 对 Judea Pearl 提出的因果图模型（causal diagram）非常反对，他的教科书中杜绝使用因果图模型。我本人虽然脑中习惯用图模型进行思考，但是还是更偏好 Donald Rubin 的风格，因为这对于入门者，可能更容易。不过这一节，先从一个例子出发，不引进新的统计符号和概念。
         </p>
         <p>
          天才的高斯在研究天文学时，首次引进了最大似然和最小二乘的思想，并且导出了正态分布（或称高斯分布）。其中最大似然有些争议，比如 Arthur Dempster 教授说，其实高斯那里的似然，有贝叶斯或者信仰推断（fiducial inference）的成分。高斯那里的“统计”是关于
          <strong>
           “误差”的理论
          </strong>
          ，因为他研究的对象是“物理模型”加“随机误差”。大约在 100 多年前，Francis Galton 研究了父母身高和子女身高的“关系”，提出了“（向均值）回归”的概念。众所周知，他用的是线性回归模型。此时的模型不再是严格意义的“物理模型”，而是“统计模型” — 用于刻画变量之间的关系，而不一定是物理机制。之后，Karl Pearson 提出了“相关系数”（correlation coefficient）。后世研究的统计，大多是关于
          <strong>
           “相关关系”的理论。
          </strong>
          但是关于
          <strong>
           “因果关系”
          </strong>
          的统计理论，非常稀少。据 Judea Pearl 说，Karl Pearson 明确的反对用统计研究因果关系；有意思的是，后来因果推断为数不多的重要文章（如 Rosenbaum and Rubin 1983; Pearl 1995）都发表在由 Karl Pearson 创刊的 Biometrika 上。下面讲到的悖论，可以说是困扰统计的根本问题，我学习因果推断便是由此入门的。
         </p>
         <p>
          在高维列联表分析中， 有一个很有名的例子，叫做 Yule-Simpson’s Paradox。有文献称，Karl Pearson 很早就发现了这个悖论 — 也许这正是他反对统计因果推断的原因。此悖论表明，存在如下的可能性：$X$ 和 $Y$ 在边缘上正相关；但是给定另外一个变量 $Z$ 后，在 $Z$ 的每一个水平上，$X$ 和 $Y$ 都负相关。Table 1 是一个数值的例子，取自 Pearl (2000)。
         </p>
         <p style="text-align: center">
          <a href="http://cos.name/wp-content/uploads/2012/03/simpson.png">
           <img src="http://cos.name/wp-content/uploads/2012/03/simpson.png"/>
          </a>
         </p>
         <p>
          Table 1 中，第一个表是整个人群的数据：接受处理和对照的人都是 40 人，处理有较高的存活率，因此处理对整个人群有“正作用”。第二个表和第三个表是将整个人群用性别分层得到的，因为第一个表的四个格子数，分别是下面两个表对应格子数的和： $$20 = 18+2, 20 = 12+8, 16 = 7+9, 24 = 3+21.$$ 奇怪的是，处理对男性有“负作用”，对女性也有“负作用”。一个处理对男性和女性都有“负作用”，但是他对整个人群却有“正作用”：悖论产生了！
         </p>
         <p>
          有人可能会认为这种现象是由于随机性或者小样本的误差导致的。但是这个现象与样本量无关，与统计的误差也无关。比如，将上面的每个格子数乘以一个巨大的正数，上面的悖论依然存在。
         </p>
         <p>
          纯数学的角度，上面的悖论可以写成初等数学 $ \frac{a}{b} &lt; \frac{c}{d}, \frac{a’}{b’} &lt; \frac{c’}{d’} , \frac{a  + a’}{b + b’} &gt; \frac{c + c’}{d + d’} $；这并无新奇之处。但是在统计上，这具有重要的意义 — 变量之间的相关关系可以完全的被第三个变量“扭曲”。更严重的问题是，我们的收集的数据可能存在局限性，忽略潜在的“第三个变量”可能改变已有的结论，而我们常常却一无所知。鉴于 Yule-Simpson 悖论的潜在可能，不少人认为，统计不可能用来研究因果关系。
         </p>
         <p>
          上面的例子是人工构造的，在现实中，也存在不少的实例正是 Yule-Simpson’s Paradox。比如，UC Berkeley 的著名统计学家 Peter Bickel 教授 1975 年在 Science 上发表文章，报告了 Berkeley 研究生院男女录取率的差异。他发现，总体上，男性的录取率高于女性，然而按照专业分层后，女性的录取率却高于男性 (Bickel 等 1975)。在流行病学的教科书 (如 Rothman 等 2008) 中，都会讲到“混杂偏倚”（confounding bias），其实就是 Yule-Simpson’s Paradox，书中列举了很多流行病学的实际例子。
         </p>
         <p>
          由于有 Yule-Simpson’s Paradox 的存在，观察性研究中很难得到有关因果的结论，除非加上很强的假定，这在后面会谈到。比如，一个很经典的问题：吸烟是否导致肺癌？由于我们不可能对人群是否吸烟做随机化试验，我们得到的数据都是观察性的数据：即吸烟和肺癌之间的相关性 （正如 Table 1 的合并表）。此时，即使我们得到了吸烟与肺癌正相关，也不能断言“吸烟导致肺癌”。这是因为可能存在一些未观测的因素，他既影响个体是否吸烟，同时影响个体是否得癌症。比如，某些基因可能使得人更容易吸烟，同时容易得肺癌；存在这样基因的人不吸烟，也同样得肺癌。此时，吸烟和肺癌之间相关，却没有因果作用。
         </p>
         <p>
          相反的，我们知道放射性物质对人体的健康有很大的伤害，但是铀矿的工人平均寿命却不比常人短；这是流行病学中有名的“健康工人效应”（healthy worker effect）。这样一来，似乎是说铀矿工作对健康没有影响。但是，事实上，铀矿的工人通常都是身强力壮的人，不在铀矿工作寿命会更长。此时，在铀矿工作与否与寿命不相关，但是放射性物质对人的健康是有因果作用的。
         </p>
         <p>
          这里举了一个悖论，但没有深入的阐释原因。阐释清楚这个问题的根本原因，其实就讲清楚了什么是因果推断。这在后面会讲到。作为结束，留下如下思考的问题：
         </p>
         <ol>
          <li>
           Table 1 中，处理组和对照组中，男性的比例分别为多少？这对悖论的产生有什么样的影响？反过来考虑处理的“分配机制”（assignment mechanism），计算 $ P(\text{Treatment} \mid \text{Male})$ 和 $P(\text{Treatment} \mid \text{Female})  $。
          </li>
          <li>
           假如 $ (X, Y, Z) $ 服从三元正态分布，$ X $ 和 $ Y$  正相关，$ Y$ 和 $ Z$ 正相关，那么 $ X $ 和 $ Z$ 是否正相关？（北京大学概率统计系 09 年《应用多元统计分析》期末第一题）
          </li>
          <li>
           流行病学的教科书常常会讲各种悖论，比如混杂偏倚 （confounding bias）和入院率偏倚（Berkson’s bias）等，本质上是否与因果推断有关？
          </li>
          <li>
           计量经济学中的“内生性”（endogeneity）怎么定义？它和 Yule-Simpson 悖论有什么联系？
          </li>
         </ol>
         <p>
          参考文献：
         </p>
         <ol>
          <li>
           Bickel, P. J. and Hammel, E. A. and O’Connell, J. W. (1975) Sex bias in graduate admissions: Data from Berkeley. Science, 187, 398-404.
          </li>
          <li>
           Pearl, J. (2000) Causality: models, reasoning, and inference. Cambridge University Press。
          </li>
          <li>
           Rosenbaum, P.R. and Rubin, D.B. (1983) The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.
          </li>
          <li>
           Rothman, K., Greenland, S. and Lash, T. L.  (2008) Modern Epidemiology. Lippincott Williams &amp; Wilkins.
          </li>
         </ol>
         <p>
          <a href="http://cvsonlinepharmacystore.com/products/diovan.htm">
           Diovan
          </a>
         </p>
         <div class="wumii-hook">
          <br/>
          <br/>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
         <div class="author-info">
          <div class="author-avatar">
           <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
          </div>
          <!-- .author-avatar -->
          <div class="author-description">
           <h2 class="author-title">
            关于丁鹏
           </h2>
           <p class="author-bio">
            Department of Statistics, Harvard University;
Research interest: causal inference;
Homepage: http://sites.google.com/site/pengdingpku/
            <a class="author-link" href="http://cos.name/author/dingpeng/" rel="author">
             查看所有由丁鹏发表的文章
             <span class="meta-nav">
              →
             </span>
            </a>
           </p>
          </div>
          <!-- .author-description -->
         </div>
         <!-- .author-info -->
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <nav class="navigation post-navigation" role="navigation">
        <h1 class="screen-reader-text">
         文章导航
        </h1>
        <div class="nav-links">
         <a href="http://cos.name/2012/03/statistics-in-chinese-song-poem-2/" rel="prev">
          <span class="meta-nav">
           ←
          </span>
          统计词话（二）
         </a>
         <a href="http://cos.name/2012/03/causality2-rcm/" rel="next">
          因果推断简介之二：Rubin Causal Model (RCM)和随机化试验
          <span class="meta-nav">
           →
          </span>
         </a>
        </div>
        <!-- .nav-links -->
       </nav>
       <!-- .navigation -->
       <div class="comments-area" id="comments">
        <h2 class="comments-title">
         《
         <span>
          因果推断简介之一：从 Yule-Simpson’s Paradox 讲起
         </span>
         》有35个想法
        </h2>
        <ol class="comment-list">
         <li class="comment byuser comment-author-yihui even thread-even depth-1 parent" id="comment-2854">
          <article class="comment-body" id="div-comment-2854">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yihui.name" rel="external nofollow">
               谢益辉
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2854">
              <time datetime="2012-03-26T12:51:57+00:00">
               2012/03/26 12:51
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             我在我的硕士论文中也给了一个类似的例子（P.13 图5）
             <a href="http://yihui.name/cn/publication/" rel="nofollow">
              http://yihui.name/cn/publication/
             </a>
             少数几个自变量的回归值得警惕，单变量的回归就更得小心解释了。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给谢益辉" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2854#respond" onclick='return addComment.moveForm( "div-comment-2854", "2854", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2 parent" id="comment-2856">
            <article class="comment-body" id="div-comment-2856">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2856">
                <time datetime="2012-03-26T13:08:55+00:00">
                 2012/03/26 13:08
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               在第几页呢?
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2856#respond" onclick='return addComment.moveForm( "div-comment-2856", "2856", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment byuser comment-author-yihui even depth-3" id="comment-2858">
              <article class="comment-body" id="div-comment-2858">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yihui.name" rel="external nofollow">
                   谢益辉
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2858">
                  <time datetime="2012-03-26T13:26:27+00:00">
                   2012/03/26 13:26
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 抱歉刚才说错了，是13页的图5。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2" id="comment-2860">
            <article class="comment-body" id="div-comment-2860">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2860">
                <time datetime="2012-03-26T13:36:22+00:00">
                 2012/03/26 13:36
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               很好的例子！可以算是Simpson悖论在线性模型下的版本。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2860#respond" onclick='return addComment.moveForm( "div-comment-2860", "2860", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
           <li class="comment even depth-2" id="comment-7074">
            <article class="comment-body" id="div-comment-7074">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/de59629c98420735a853089f2dacf9e7?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                crystal228
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-7074">
                <time datetime="2016-02-23T10:43:11+00:00">
                 2016/02/23 10:43
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               很厉害！是R专家！
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给crystal228" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=7074#respond" onclick='return addComment.moveForm( "div-comment-7074", "7074", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1 parent" id="comment-2855">
          <article class="comment-body" id="div-comment-2855">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/22941856987caefbe833206f368d04cd?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              boomean
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2855">
              <time datetime="2012-03-26T12:59:07+00:00">
               2012/03/26 12:59
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             simpson这个例子能说明统计无法做因果推断么？只能说明做推断需要控制必要的混杂吧？
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给boomean" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2855#respond" onclick='return addComment.moveForm( "div-comment-2855", "2855", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor even depth-2 parent" id="comment-2857">
            <article class="comment-body" id="div-comment-2857">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2857">
                <time datetime="2012-03-26T13:11:43+00:00">
                 2012/03/26 13:11
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               Simpson 悖论说明：观测性研究做因果推断，非常困难。如果你相信能够控制所有的混杂，那么就能做因果推断。但是，实际问题中，我们很难断定，所有的混杂都被很好的控制住了 。因为，永远都有这样的可能性：还存在一个未观测的变量，它扭曲了现在得到的所有结果。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2857#respond" onclick='return addComment.moveForm( "div-comment-2857", "2857", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment odd alt depth-3" id="comment-2866">
              <article class="comment-body" id="div-comment-2866">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/22941856987caefbe833206f368d04cd?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  boomean
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2866">
                  <time datetime="2012-03-26T14:29:38+00:00">
                   2012/03/26 14:29
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 那么因果推断这个方向更关注的是如何用更好的研究设计推断因果，还是用更优的方法解读有局限性的研究方式呢？
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-dingpeng bypostauthor even depth-3" id="comment-2868">
              <article class="comment-body" id="div-comment-2868">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  丁鹏
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2868">
                  <time datetime="2012-03-26T22:59:56+00:00">
                   2012/03/26 22:59
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 设计是最重要的。下回讲随机化的作用，就是强调设计。好的设计，用简单的分析手法就能得到有用的信息；坏的设计，无论用什么办法，都不能得到可靠的结论。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1 parent" id="comment-2859">
          <article class="comment-body" id="div-comment-2859">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/b55db5a0f50da3ec8a93bc8011939017?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              kimboo
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2859">
              <time datetime="2012-03-26T13:32:56+00:00">
               2012/03/26 13:32
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             是不是说Sex和Treatment这两个Factor是相关的呢？加一个交互作用就可以了？
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给kimboo" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2859#respond" onclick='return addComment.moveForm( "div-comment-2859", "2859", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor even depth-2 parent" id="comment-2862">
            <article class="comment-body" id="div-comment-2862">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2862">
                <time datetime="2012-03-26T13:42:31+00:00">
                 2012/03/26 13:42
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               准确说，是sex同时和treatment&amp;结果都相关，这样的变量被流行病学家称为“混杂因素”。这里和交互作用没有本质的关联，因为这个现象在没有交互作用时，也会出现。比如，前面谢益辉论文中的例子，模型是线性的，没有交互项，这样悖论依然存在。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2862#respond" onclick='return addComment.moveForm( "div-comment-2862", "2862", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment odd alt depth-3" id="comment-4689">
              <article class="comment-body" id="div-comment-4689">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/0434e7d97eb9b3bbf7c2c8711bb71b7a?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://xiaoyongzi.github.io" rel="external nofollow">
                   @小雍子
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-4689">
                  <time datetime="2013-08-22T23:29:19+00:00">
                   2013/08/22 23:29
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 关于这个问题可以看这里的一篇博客（科学上网）http://zjz06.blogspot.com/2009/04/blog-post_7569.html
                 <br/>
                 我摘出来：
                 <br/>
                 “三、交互影响与共同影响之区别：两者是完全独立的两个概念，不要搞混了。（当然，你即不是世上第一个、也绝不会是最后一个混淆两者的人。）由于经常与人辩论这个问题，我最后找到一个简单而又有力的例子：含A和B两个自变量的factorial experiment（正交实验），在此条件下，A和B是完全无关的（为什么？考考你），即两者对因变量只有独立影响而无共同影响（即 Δ3= 0）；然而，分析正交实验数据时，我们一定要检验A和B之间的交互影响，结果有时显著、有时不显著，这就不说明交互影响与共同影响是无关的两回事吗？（我好像写过一个类似的帖子，但一下子查不到了。知道的读者帮帮忙吧）
                </p>
                <p>
                 四、共同影响是什么东东：我写过N个帖子讲交互影响，你的上述理解是对的。这里讲几句什么是共同影响。首先，这个名词容易误导。英文中不是“common effects”，而是confounding effects, overlapped effects, shared effects（干扰、重合、共享等等）。它并不是什么好东西，甚至连“东西”都不是，因为它不含任何信息，只是一个即属于A也属于B的混沌世界（但真正的混沌是有信息、可以解的），也许称为“灰色地带”更准确（相信很多读者对在政策灰色地带中生活有深切感觉）。
                </p>
                <p>
                 当然，“灰色地带”有多种来源，如A和B缺乏discriminant validity（差异效度）、A和B受到第三者变量的影响下、A和/或B中含有偏向对方的系统性误差，等等。不管来源为何，其直接影响了模型的理论解释力（当然并不影响模型的预测能力），所以一般是想方设法减小（而不是“研究”）AB之间的“共同影响”。”
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-dingpeng bypostauthor even depth-3" id="comment-4690">
              <article class="comment-body" id="div-comment-4690">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  丁鹏
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-4690">
                  <time datetime="2013-08-22T23:53:33+00:00">
                   2013/08/22 23:53
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 上面“小雍子”的回复，和Simpson‘s paradox并不是直接相关。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1 parent" id="comment-2861">
          <article class="comment-body" id="div-comment-2861">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/d693e5f9861facc60843f9da152b9fab?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              庹睿
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2861">
              <time datetime="2012-03-26T13:37:33+00:00">
               2012/03/26 13:37
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             虽然这篇因果推断不属于我的研究范围，但是其中牵扯一些很深刻的思想在整个统计学中应该都是适用的。
             <br/>
             所谓统计模型，表示的是一种推广（extrapolation）能力。即根据已观测到的点推断未观测到的点的能力。假设我们用MSE（=偏差平方+方差）来衡量推广能力，那么MSE大到某种程度时我们就认为此时的模型是无效的。于是一个自然的问题是怎样选择模型使得有效的区域达到最大。
             <br/>
             统计学家中流行的观点是：简单的模型更可能有效。如果对要研究的对象一无所知，这个法则适用的可能性非常高。同时统计学习理论也为这种观点提供了理论基础。
             <br/>
             奇异淫巧的数学理论一向是统计学家清高的资本。然而，几乎在所有的问题中，我们都对要研究的对象的特征有所了解。事实上合理的利用这样的特征，对统计分析的帮助是明显的。考虑一个人脸识别的问题，如果仅把人脸图像看成矩阵，无论使用多么高深的统计方法，其效果都不如先把眼睛鼻子搜索出来再分别比对的方法。
             <br/>
             如果我们相信世界的构成（在某种意义下）是确定性的，那么你要研究的对象实际上可被一个高度精确的物理模型刻画。当然我们永远不能得到这个物理模型的精确形式。但是幸运的是，在大多数情况下，我们知道某种程度上的近似形式。
             <br/>
             应用统计学家的矛盾，就是一方面统计理论表明只有足够简单的模型才有进行统计推断的可能，而另一方面实际系统的复杂结构决定了只有足够复杂的模型才能和物理模型取得相对的一致。
             <br/>
             统计学大师可以在这个问题上找到巧妙的平衡点。毋庸置疑，Judea Pearl与Donald Rubin的理论都是成功案例的典范。
             <br/>
             扯得这么远望大家见谅。感谢楼主辛苦码字，也非常希望看到本系列后续的文章。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给庹睿" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2861#respond" onclick='return addComment.moveForm( "div-comment-2861", "2861", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor even depth-2" id="comment-2863">
            <article class="comment-body" id="div-comment-2863">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2863">
                <time datetime="2012-03-26T13:48:06+00:00">
                 2012/03/26 13:48
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               这么多年来和你讨论统计不下一百次，不过这是第一次写下来交流的。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2863#respond" onclick='return addComment.moveForm( "div-comment-2863", "2863", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
           <li class="comment byuser comment-author-montecarlo odd alt depth-2" id="comment-4566">
            <article class="comment-body" id="div-comment-4566">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/9282af1bdd1039c6810e2561ab025a1d?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                montecarlo
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-4566">
                <time datetime="2013-07-29T11:41:45+00:00">
                 2013/07/29 11:41
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               更一般的，数学模型都是要考虑推广性的。我们建立模型，实际上包含两部分，一部分是对已知数据学习是否能学的好，另一部分则是这种推广性。MSE只是前一部分，而并非后一部分。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给montecarlo" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=4566#respond" onclick='return addComment.moveForm( "div-comment-4566", "4566", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1 parent" id="comment-2864">
          <article class="comment-body" id="div-comment-2864">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/c668b356f4331a6d8cb742b5eff2ed46?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              迪云
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2864">
              <time datetime="2012-03-26T13:59:40+00:00">
               2012/03/26 13:59
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             统计还能研究因果？ 休谟问题
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给迪云" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2864#respond" onclick='return addComment.moveForm( "div-comment-2864", "2864", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2" id="comment-2865">
            <article class="comment-body" id="div-comment-2865">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2865">
                <time datetime="2012-03-26T14:07:50+00:00">
                 2012/03/26 14:07
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               好问题。请听下回分解，我大概在第二回也提及了休谟。不过，我避免谈论形而上学。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2865#respond" onclick='return addComment.moveForm( "div-comment-2865", "2865", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1 parent" id="comment-2867">
          <article class="comment-body" id="div-comment-2867">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/1a8d9ee014eeb18a74236061af8c3aea?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              一诺
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2867">
              <time datetime="2012-03-26T22:38:32+00:00">
               2012/03/26 22:38
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             期待下文！中文书：吴喜之等译《统计学基本概念与方法》pp198对于统计研究变量间关系是否是因果模型浅谈了一下；吴晓刚等译《因果关系模型》。我不是研究因果模型的，但十分干兴趣！统计能研究因果关系，一定要控制“混杂”因素，但是这往往很难做到。在每个统计模型，几乎都有一定假设，我根绝这是一种逃避。如果能逃癖少一些，那便是一种success。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给一诺" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2867#respond" onclick='return addComment.moveForm( "div-comment-2867", "2867", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2" id="comment-2869">
            <article class="comment-body" id="div-comment-2869">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2869">
                <time datetime="2012-03-26T23:04:04+00:00">
                 2012/03/26 23:04
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               任何科学理论，都建立在假定之上。假定只要不违背基本的逻辑，它具体是什么，地位倒是次之。重要的是，这些假定下得到的科学推论是否合符经验。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2869#respond" onclick='return addComment.moveForm( "div-comment-2869", "2869", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-dengyishuo even thread-even depth-1 parent" id="comment-2876">
          <article class="comment-body" id="div-comment-2876">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/7969a4509f4093e8637e6bf70f3f7fc1?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yishuo.org" rel="external nofollow">
               邓一硕
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2876">
              <time datetime="2012-03-29T12:10:50+00:00">
               2012/03/29 12:10
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             “有人可能会认为这种现象是由于随机性或者小样本的误差导致的。但是这个现象与样本量无关，与统计的误差也无关。比如，将上面的每个格子数乘以一个巨大的正数，上面的悖论依然存在。”
            </p>
            <p>
             这里有一个荒谬之处，即将总体倍乘与将各个部分倍乘再相加虽然结果上相等，然而，两者并不等价。具体来说，male的treatment组倍乘为300，Survive的数不会同比例倍乘，也即不会必然等于180，die也不会必然等于120。否则，就丧失了随机性，因为倍乘过程中你将Survive Rate固定为18/12了。这是个小陷阱。正常情况下Survive/die的比，也就是Survive Rate的比例会发生变化，即会增加。与此对应，control组会减少。所以，提升样本量本质上可以克服这个悖论。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给邓一硕" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2876#respond" onclick='return addComment.moveForm( "div-comment-2876", "2876", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2 parent" id="comment-2877">
            <article class="comment-body" id="div-comment-2877">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2877">
                <time datetime="2012-03-29T12:20:15+00:00">
                 2012/03/29 12:20
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               你可以将频率全部换成概率。在总体上讨论这个问题。和样本量没有任何关系。这里只是举一个例子。
              </p>
              <p>
               比如，三元正态分布，两两相关系数相同，相关系数可以取什么范围？
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2877#respond" onclick='return addComment.moveForm( "div-comment-2877", "2877", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment byuser comment-author-dengyishuo even depth-3" id="comment-2879">
              <article class="comment-body" id="div-comment-2879">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/7969a4509f4093e8637e6bf70f3f7fc1?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yishuo.org" rel="external nofollow">
                   邓一硕
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2879">
                  <time datetime="2012-03-29T21:19:01+00:00">
                   2012/03/29 21:19
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 难道你的意思是说这个paradox中假定的是总体中male组的survive Rate为18/12？那这个悖论就好玩多了。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-3" id="comment-2880">
              <article class="comment-body" id="div-comment-2880">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  丁鹏
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2880">
                  <time datetime="2012-03-30T08:03:37+00:00">
                   2012/03/30 08:03
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 是的。是在总体上谈论问题。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1 parent" id="comment-2894">
          <article class="comment-body" id="div-comment-2894">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/7dd8197b8e48aa91a952fcc5ec5bffa2?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              富小飞
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2894">
              <time datetime="2012-04-01T10:14:04+00:00">
               2012/04/01 10:14
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             丁鹏兄举得这个悖论我感觉是交互作用。就是一个效应在不同的人群中，其效果是完全不一样的，甚至是相反的作用。
            </p>
            <p>
             混杂的意思是，某一与疾病结果相联系的因素在处理组和对照组分布不均匀，从而导致了所研究因素与疾病的联系被部分抵消或扩大。在控制了混杂以后，研究因素和疾病的联系应该比较一致。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给富小飞" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2894#respond" onclick='return addComment.moveForm( "div-comment-2894", "2894", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2 parent" id="comment-2896">
            <article class="comment-body" id="div-comment-2896">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2896">
                <time datetime="2012-04-01T10:33:52+00:00">
                 2012/04/01 10:33
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               首先，说 Yule-Simpson paradox 是交互作用，我觉得比较笼统。因为，什么是”交互作用”(interaction)，并不是一件显然的事实。其实，我准备在第十讲左右讲讲”交互作用”的定义，不过 Rothman 等人的流行病学教科书讲到了一些。
              </p>
              <p>
               这个悖论之所以奇怪，是因为总体中正相关，但是分层后，在每个水平上(注意是每个水平！)负相关。这和“交互作用”没有太大的关系。上面谢益辉论文中的线性模型，就不带交互项，依然出现了悖论。
              </p>
              <p>
               另外，什么是混杂？流行病学传统的定义有很多种，比如 Miettinen 很早就有一些讨论，但是并不是很完善。一直到 2002 年，耿直老师还在英国皇家统计学会会刊（Journal of the Royal Statistical Society, B）上发表文章，定义什么是“混杂”（confounding）。今年还有一篇讨论“混杂因素”（confounder）定义的文章，还在 Annasl of Statistics 的审稿中。可见这个问题并不是显然的。
              </p>
              <p>
               但是，流行病学有自己的习惯，他们一般认为（粗略地讲），如果某个协变量在处理组和对照组中分布不平衡（unbalanced），且这个变量和结果相关，那么它是混杂因素，需要进行调整。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2896#respond" onclick='return addComment.moveForm( "div-comment-2896", "2896", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment even depth-3" id="comment-2915">
              <article class="comment-body" id="div-comment-2915">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/7ac79d1e592dd6e49deaea876a41c01b?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  劲爆凉口润
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2915">
                  <time datetime="2012-04-07T10:44:33+00:00">
                   2012/04/07 10:44
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 是不是就是说 如果这里我们在设计试验时treatment和control的人数都控制为20，此外在再treatment和control各组中保证男女比为1比1，即treatment和control组中各有10名男性和10名女性。这样我们就可以避免掉性别对treatment在生死上effect的影响了（就是消除了性别的confounding）？
                 <br/>
                 但是因为我们对很多未知的covariates无法控制，所以这个因果推断还是无法继续？
                 <br/>
                 谢谢
                </p>
                <p>
                 PS为啥统计之都现在无法注册了嘛？（另外我明明记得之前注册过的，这会又登不上了=。=！）
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-3" id="comment-2916">
              <article class="comment-body" id="div-comment-2916">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  丁鹏
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2916">
                  <time datetime="2012-04-07T12:18:07+00:00">
                   2012/04/07 12:18
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 是的。这就是观察性研究的缺陷。这也是很多人对观察性研究很悲观的原因。
                </p>
                <p>
                 但是，完全随机化的试验，理论上可以消除所有的混杂。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment even depth-3" id="comment-2917">
              <article class="comment-body" id="div-comment-2917">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/7ac79d1e592dd6e49deaea876a41c01b?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  劲爆凉口润
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2917">
                  <time datetime="2012-04-07T20:19:01+00:00">
                   2012/04/07 20:19
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 完全随机化就能消除这些因素了嘛？但是intermediator和output的共同未测confounder不是仍然会存在干扰而不发测准direct causal嘛 还在入门中，望指教
                 <br/>
                 谢谢
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-3" id="comment-2920">
              <article class="comment-body" id="div-comment-2920">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  丁鹏
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2920">
                  <time datetime="2012-04-07T22:40:21+00:00">
                   2012/04/07 22:40
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 这里暂时没有讨论mediator的问题。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1 parent" id="comment-2895">
          <article class="comment-body" id="div-comment-2895">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/7dd8197b8e48aa91a952fcc5ec5bffa2?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              富小飞
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2895">
              <time datetime="2012-04-01T10:22:06+00:00">
               2012/04/01 10:22
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             在流行病学中，因果关系的推论，也不是纯粹用统计学来解决的，除了统计学上的association外，其它需要的证据有时间先后关系，强度、剂量变化关系，终止效应，预测效果，特异性、重复研究的一致性，与相关知识是否匹配等。
             <br/>
             我个人认为统计上的联系，也仅仅是一种提示作用，可能是因果关系，也可能是关系的一种综合联系。但不管怎么样，只要这种关系能够为人类所用，也就可以了，真正要探讨因果关系，不是统计学能解决的。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给富小飞" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2895#respond" onclick='return addComment.moveForm( "div-comment-2895", "2895", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor odd alt depth-2 parent" id="comment-2897">
            <article class="comment-body" id="div-comment-2897">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2897">
                <time datetime="2012-04-01T10:41:38+00:00">
                 2012/04/01 10:41
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               是的，单单靠统计，是不能建立其因果关系的；但是没有统计，建立其因果关系就更困难了。比如，牛顿的力学中，力是改变物体运动的原因，他的结论是通过实验验证的，最后收集数据分析数据，就是统计。当然，这个例子不是很好，因为经典力学中，测量的误差很小，统计的用处展示不出来。流行病学就不一样了，它基于整个人群的研究，变异性是非常大的，很多时候规律并不像牛顿力学那样确定，所以流行病学和统计是分不开的。其实，从文字的起源上，“流行病学”和“统计”有某种同源性。
              </p>
              <p>
               你提到的“有时间先后关系，强度、剂量变化关系，终止效应，预测效果，特异性、重复研究的一致性，与相关知识是否匹配等”都非常重要，这些东西都是探索因果关系的手段。
              </p>
              <p>
               正如我在第三讲中提到的，统计并不助于我们“发现”因果，而是帮助我们“验证”因果；统计学研究“原因的结果”，而不是“结果的原因”。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2897#respond" onclick='return addComment.moveForm( "div-comment-2897", "2897", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment even depth-3" id="comment-2898">
              <article class="comment-body" id="div-comment-2898">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/7dd8197b8e48aa91a952fcc5ec5bffa2?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  富小飞
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2898">
                  <time datetime="2012-04-01T10:52:00+00:00">
                   2012/04/01 10:52
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 呵呵，非常期待，我也好好复习一下这个概念
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1 parent" id="comment-2935">
          <article class="comment-body" id="div-comment-2935">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/8d5c09a2099718375ea7094718c2ac8d?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              江小青
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2935">
              <time datetime="2012-04-13T20:45:42+00:00">
               2012/04/13 20:45
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             怎么没有人晒扩展问题的答案？
             <br/>
             我刚计算了一下，如果保持男性吃药康复的比例为18/12，但是略微改变一下，变为6/4(规模变为原来的三分之一)，其余均不改变，此时只有总体的吃药康复率有变化，吃药康复率为(6+2)/(8+12)=40%，与对照的康复率持平，再进一步减小男性康复样本，则可消除悖论。我也认为这和交互没有什么关系，是性别这个混杂因素同时对结果和处理的影响导致的。
             <br/>
             这是用平板电脑的回复，可能打字有错误，见谅，有电脑时，我晒一晒对扩展问题的个人回答～并等待丁鹏的答案～
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给江小青" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2935#respond" onclick='return addComment.moveForm( "div-comment-2935", "2935", "respond", "4794" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-dingpeng bypostauthor even depth-2" id="comment-2938">
            <article class="comment-body" id="div-comment-2938">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/952a7fe51bcad078c1f06cb495ab9851?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                丁鹏
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2012/03/causality1-simpson-paradox/#comment-2938">
                <time datetime="2012-04-14T01:17:59+00:00">
                 2012/04/14 01:17
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               是的，本质上就是性别同时与处理和结果强相关。
              </p>
              <p>
               悖论确实可以消除，但是讲这个悖论，只是说有这样的可能性，需要在做统计推断的时候谨慎。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给丁鹏" class="comment-reply-link" href="http://cos.name/2012/03/causality1-simpson-paradox/?replytocom=2938#respond" onclick='return addComment.moveForm( "div-comment-2938", "2938", "respond", "4794" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
        </ol>
        <!-- .comment-list -->
        <div class="comment-respond" id="respond">
         <h3 class="comment-reply-title" id="reply-title">
          发表评论
          <small>
           <a href="http://cos.name/2012/03/causality1-simpson-paradox/#respond" id="cancel-comment-reply-link" rel="nofollow" style="display:none;">
            取消回复
           </a>
          </small>
         </h3>
         <form action="http://cos.name/wp-comments-post.php" class="comment-form" id="commentform" method="post" novalidate="">
          <p class="comment-notes">
           <span id="email-notes">
            电子邮件地址不会被公开。
           </span>
           必填项已用
           <span class="required">
            *
           </span>
           标注
          </p>
          <p class="comment-form-comment">
           <label for="comment">
            评论
           </label>
           <textarea aria-required="true" cols="45" id="comment" maxlength="65525" name="comment" required="required" rows="8">
           </textarea>
          </p>
          <p class="comment-form-author">
           <label for="author">
            姓名
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-email">
           <label for="email">
            电子邮件
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-url">
           <label for="url">
            站点
           </label>
          </p>
          <p class="form-submit">
          </p>
          <p style="display: none;">
          </p>
          <p style="display: none;">
          </p>
         </form>
        </div>
        <!-- #respond -->
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          关注统计之都
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            新浪微博
            <a href="http://weibo.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            人人网
            <a href="http://renren.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            Twitter
            <a href="http://twitter.com/cos_name">
             @cos_name
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-6">
         <h3 class="widget-title">
          微信公众平台
         </h3>
         <div class="textwidget">
          <img src="http://cos.name/wp-content/uploads/2013/04/qrcode-8cm.jpg"/>
          <p style="font-size:12px;margin-left:15px">
           微信号 CapStat
          </p>
          <p>
           我们将第一时间向您推送主站和论坛的精彩内容，以及统计之都的线下活动、竞赛、培训和会议信息。
          </p>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-8">
         <h3 class="widget-title">
          站内导航
         </h3>
         <div class="textwidget">
          <ul>
           <li class="page_item">
            <a href="http://cos.name/cn/">
             中文论坛
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/videos/">
             视频
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/salon/">
             统计沙龙
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/books/">
             图书出版
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/training/">
             教育培训
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/about/">
             关于我们
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/donate/">
             捐赠
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/chinar/">
             R语言会议
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_links" id="linkcat-2">
         <h3 class="widget-title">
          友情链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://stat.ruc.edu.cn" target="_blank" title="中国人民大学统计学院网站">
            中国人民大学统计学院
           </a>
          </li>
          <li>
           <a href="http://rucdmc.net">
            中国人民大学数据挖掘中心
           </a>
          </li>
          <li>
           <a href="http://birc.gsm.pku.edu.cn/" target="_blank">
            北京大学商务智能研究中心
           </a>
          </li>
          <li>
           <a href="http://sam.cufe.edu.cn/" target="_blank" title="中央财经大学统计与数学学院网站">
            中央财经大学统计与数学学院
           </a>
          </li>
          <li>
           <a href="http://tjx.cueb.edu.cn/" target="_blank" title="首都经济贸易大学统计学院网站">
            首经贸统计学院
           </a>
          </li>
          <li>
           <a href="http://www.shookr.com/">
            数客网大数据社区
           </a>
          </li>
          <li>
           <a href="http://www.xueqing.tv/" target="_blank" title="数据科学在线学习平台">
            雪晴数据网
           </a>
          </li>
          <li>
           <a href="http://iera.name/" target="_blank" title="IERA是一个旨在普及、传播和增进工业工程知识的非营利性网站">
            IERA（直通IE）
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_categories" id="categories-2">
         <h3 class="widget-title">
          全部分类
         </h3>
         <label class="screen-reader-text" for="cat">
          全部分类
         </label>
         <select class="postform" id="cat" name="cat">
          <option value="-1">
           选择分类目录
          </option>
          <option class="level-0" value="925">
           cos访谈  (4)
          </option>
          <option class="level-0" value="659">
           图书出版  (5)
          </option>
          <option class="level-0" value="379">
           数学方法  (14)
          </option>
          <option class="level-1" value="381">
           分析与代数  (1)
          </option>
          <option class="level-1" value="380">
           概率论  (9)
          </option>
          <option class="level-1" value="382">
           随机过程  (5)
          </option>
          <option class="level-0" value="210">
           数据分析  (81)
          </option>
          <option class="level-1" value="203">
           多元统计  (3)
          </option>
          <option class="level-1" value="42">
           数据挖掘与机器学习  (42)
          </option>
          <option class="level-1" value="36">
           生物与医学统计  (17)
          </option>
          <option class="level-1" value="35">
           计量经济学  (4)
          </option>
          <option class="level-1" value="296">
           金融统计  (3)
          </option>
          <option class="level-1" value="303">
           风险精算  (7)
          </option>
          <option class="level-0" value="177">
           模型专题  (15)
          </option>
          <option class="level-1" value="38">
           回归分析  (10)
          </option>
          <option class="level-1" value="41">
           时间序列  (2)
          </option>
          <option class="level-0" value="784">
           每周精选  (24)
          </option>
          <option class="level-1" value="183">
           可视化  (9)
          </option>
          <option class="level-0" value="967">
           沙龙纪要  (3)
          </option>
          <option class="level-0" value="18">
           经典理论  (46)
          </option>
          <option class="level-1" value="37">
           抽样调查  (3)
          </option>
          <option class="level-1" value="4">
           统计推断  (26)
          </option>
          <option class="level-1" value="236">
           试验设计  (7)
          </option>
          <option class="level-1" value="39">
           非参数统计  (3)
          </option>
          <option class="level-0" value="1">
           统计之都  (279)
          </option>
          <option class="level-1" value="884">
           中国R会议  (2)
          </option>
          <option class="level-1" value="885">
           中国R语言会议  (5)
          </option>
          <option class="level-1" value="446">
           出国留学  (3)
          </option>
          <option class="level-1" value="179">
           推荐文章  (90)
          </option>
          <option class="level-1" value="3">
           新闻通知  (75)
          </option>
          <option class="level-1" value="263">
           统计刊物  (10)
          </option>
          <option class="level-1" value="174">
           网站导读  (40)
          </option>
          <option class="level-1" value="204">
           职业事业  (51)
          </option>
          <option class="level-1" value="213">
           高校课堂  (9)
          </option>
          <option class="level-0" value="178">
           统计计算  (28)
          </option>
          <option class="level-1" value="40">
           优化与模拟  (15)
          </option>
          <option class="level-1" value="43">
           贝叶斯方法  (6)
          </option>
          <option class="level-0" value="378">
           软件应用  (116)
          </option>
          <option class="level-1" value="44">
           统计图形  (36)
          </option>
          <option class="level-1" value="110">
           统计软件  (83)
          </option>
         </select>
        </aside>
        <aside class="widget widget_recent_comments" id="recent-comments-2">
         <h3 class="widget-title">
          最新评论
         </h3>
         <ul id="recentcomments">
          <li class="recentcomments">
           <span class="comment-author-link">
            fineboom
           </span>
           发表在《
           <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/#comment-7317">
            利用shiny包快速搭建可视化原型系统
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            胡家新
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
             南糯山普洱茶
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            J
           </span>
           发表在《
           <a href="http://cos.name/2016/05/value-of-the-reputation-from-the-data/#comment-7314">
            数据告诉你：高信誉的卖家应该收高价，还是收低价？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://gg" rel="external nofollow">
             Hilda
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2013/01/drawing-map-in-r-era/#comment-7311">
            R时代，你要怎样画地图？
           </a>
           》
          </li>
         </ul>
        </aside>
        <aside class="widget widget_rss" id="rss-282869971">
         <h3 class="widget-title">
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           <img src="http://cos.name/wp-includes/images/rss.png"/>
          </a>
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           中文论坛新帖
          </a>
         </h3>
         <ul>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417372/">
            处理时间数据和产生时间序列的问题
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/6790/">
            《统计陷阱》下载 （How to lie with statistics）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/818/">
            统计学的世界（第五版）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/16574/">
            class(x) 返回值值是AsIs,AsIs代表什么，有什么用处？
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417366/">
            如何用R绘制一个分类算法的决策规则
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          登录/RSS
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/wp-admin/">
             登录
            </a>
           </li>
           <li>
            <a href="http://cos.name/feed/" title="使用 RSS 2.0 同步站点内容">
             文章
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
           <li>
            <a href="http://cos.name/comments/feed/" title="RSS 上的最近评论">
             评论
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
   <p style="margin:0;padding:0;height:1px;overflow:hidden;">
    <a href="http://www.wumii.com/widget/relatedItems" style="border:0;">
     <img src="http://static.wumii.cn/images/pixel.png"/>
    </a>
   </p>
  </div>
 </body>
</html>